查看原文
其他

NAR︱薛宇团队开发热图绘制及富集分析在线服务平台

魏宇翔 岚翰生命科学 2023-03-10


                     

撰文︱魏宇翔

责编︱王思珍

编辑︱杨彬伟


随着高通量组学技术产生的大生物数据的快速增长,对多维和数字数据的可视化需求迫切增加。如何快速、直观地检索大数据中包含的信息变得越来越重要[1]热图heatmap可以用颜色代表数字,一幅简洁、精巧、精确的热图比单纯的文字描述有很大的优势[2]然而,对大多生物学家来讲,很难通过代码生成高质量的热图。


富集分析(enrichment analyses)可以找出差异表达的基因所显着富集的功能类别,生物学家经常在数据聚类和热图说明后对选定的基因进行富集分析[3,4]。因此,能够快速简单地生成热图并能对数据进一步分析具有重要的科研意义。


2022年6月7日,华中科技大学生命学院薛宇教授团队在国际著名期刊Nucleic Acids Research发表题为“HemI 2.0: an online service for heatmap illustration”的论文,提供了一款可以快速生成高质量热图和聚类,并对差异基因进行富集分析的在线服务



如今,高通量组学技术产生了大量的生物学数据。组学数据的可视化对于回答广泛的生物学问题至关重要。热图中二维数据矩阵的可视化是一种简单但有效的数据分析和解释方法(图1A, B)。矩阵中的值可以表示任何可测量的属性,例如生物分子表达值。


通过HemI 2.0生成的热图

(图源:Wanshan Ning, et al.Nucleic Acids Res, 2022


2014年,一个基于JAVA的独立软件包HemI 1.0为不熟悉编程的生物学家提供了便捷的热图生成方法[2]。在HemI 1.0中,实现了3种聚类方法和7种距离度量,热图可以以自定义方式可视化、重新着色、重新缩放、旋转或导出[2]。在过去的几年中,HemI 1.0已经成为生物学家常用的一个工具,许多用户与作者进行了交流,并指出了该工具的优缺点。根据用户的需求和建议,作者对HemI进行了重大改进,开发了基于HTML5的在线服务,其中包括7种聚类方法和22种距离度量。为了进一步的数据分析,薛宇团队编辑了15种类型的功能注释,并添加了一个基于12种模式生物的超几何测试的富集分析选项,以及富集结果的可视化。特别的是,HemI 2.0可以下载高质量热图、聚类结果和富集分析结果,以供学术使用。


HemI 2.0支持多种文件格式的数据加载,包括Microsoft Excel工作表(.xls or .xlsx),文本文件(.txt)和字符分隔值文件(.csv)。文件上传后,数据将会在网页生成一张可交互的表格,通过点击选择范围或更改行列标签后(图2A),单击“Submit”按钮即可快速出图。HemI2.0的热图默认参数可适配广泛的场景,用户也可以单击“Heatmap Settings”按钮(图2B),以自定义方式轻松操纵生成的热图。如需以行和列对相应的数据进行聚类,用户可以通过单击“Clustering Settings”按钮来选择聚类方法和距离度量(图2B)。在“HEATMAP DISPLAY”页面的表格中,用户不仅可以通过鼠标右键点击行或列标签,将最多三层注释添加到热图中,而且可以通过鼠标左键单击一个或多个行标签来选择用于显示热图的基因或蛋白质,以进行进一步的富集分析。


HemI 2.0提供输入框,支持用户自定义添加基因或蛋白质到待进行富集分析的列表中。选择物种和功能注释后,点击“Enrichment Analysis按钮即可进行富集分析(图2C)。富集分析的结果将以表格形式展现在网页,用户通过点击表格选择通道后即可得到5种常用的可视化结果。如有需求,点击“Graphics Settings”按钮(图2D),可自定义重新调整图片。


通过HemI 2.0生成的热图

(图源:Wanshan Ning, et al.Nucleic Acids Res2022


HemI 2.0免费向所有人服务(https://hemi.biocuckoo.org/),关于HemI2.0的使用教程以及各种方法和注释请参照(https://hemi.biocuckoo.org/documentation/)。


文章结论与讨论,启发与展望
综上所述,该工具为众多生物学家提供了简单易操作的生成热图和聚类的方法,并且可以进一步对数据进行富集分析。HemI 2.0丰富的自定义设置可以满足绝大多数用户的需要,聚类结果和富集分析结果支持文档和图片多种方式下载。目前,HemI 2.0还存在一些不足。比如HemI 2.0仅支持数据矩阵热图,还不能处理基于图像的热图,如choropleth map和geospatial heatmap。未来,作者将包括更多的热图可视化类型,并在下一版本的HemI中实现实时交互。此外,网页仅提供了15种富集分析方法。在不久的将来,将包括更多的基因集和更多的富集分析方法。


原文链接:https://doi.org/10.1093/nar/gkac480 


通讯作者薛宇教授

(照片提供自华中科技大学生命学院薛宇团队)


人才招聘

【1】“ 岚翰生命科学 ”诚聘副主编/编辑/运营岗位 ( 在线办公)

往期文章精选

【1】Sci Adv︱刘际团队揭示下丘脑GLP-1信号通过下行迷走神经环路调控血糖代谢的神经机制

【2】Cell Death Dis︱袁凤来团队发现ASIC3和巨噬细胞调节皮肤纤维化新机制

【3】Nat Commun︱刘亮课题组揭示四膜虫DNA 6mA甲基化的分子机制

【4】Front Cell Dev Biol | 黄志超团队在唐氏综合症发育过程中寻找关键神经病变

【5】Cell Death Dis 综述︱任骏团队聚焦线粒体相关内质网膜调节细胞死亡在心血管疾病中的作用机制

【6】Frontiers Immunol︱李鹏团队揭示CCR8可作为治疗T细胞恶性肿瘤潜在的治疗靶点

【7】eLife︱吕红斌团队揭示力学刺激促进骨腱界面损伤修复新机制

【8】Cell Death Dis︱姚颖/曾锐教授团队发现Connexin 43有望成为延缓肾间质纤维化进展的新靶

【9】Cell Death Dis︱邹晓平/陆云杰团队合作发现肝再生新机制

【10】Nat Commun︱宋尔卫院士团队发现免疫联合抗血管及艾立布林三联治疗方案显著改善晚期三阴性乳腺癌预后


参考文献(上下滑动阅读)  


1. Meyer,R.D. and Cook,D. (2000) Visualization of data. Curr. Opin. Biotechnol., 11, 89–96.

2. Deng,W., Wang,Y., Liu,Z., Cheng,H. and Xue,Y. (2014) HemI: a toolkit for illustrating heatmaps. PLoS One, 9, e111988.

3. Liu,X., Hu,P., Huang,M., Tang,Y., Li,Y., Li,L. and Hou,X. (2016) The NF-YC-RGL2 module integrates GA and ABA signalling to regulate seed germination in Arabidopsis. Nat. Commun., 7, 12768.

4. Chung,K.P., Hsu,C.L., Fan,L.C., Huang,Z., Bhatia,D., Chen,Y.J., Hisata,S., Cho,S.J., Nakahira,K., Imamura,M. et al. (2019) Mitofusins regulate lipid metabolism to mediate the development of lung fibrosis. Nat. Commun., 10, 3390




本文完

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存